문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 캐시 메모리 (문단 편집) ==== CPU 캐시 메모리 ==== 초창기 캐시 메모리는 1969년에 출시된 [[IBM]]의 System/360 Model 85부터 존재했다. 지금의 메인 메모리처럼 카드 및 스틱 형태의 모듈이나 메인보드에 붙어서 CPU와 메인 메모리 사이에 독립적인 칩으로 존재했으나, CPU 집적도가 높아지면서 [[모토로라 68000]] 시리즈 기준 1984년에 출시된 68020부터, [[x86]] 기준으로 1989년에 출시된 [[인텔 80486]]부터 CPU 안에 캐시 메모리가 포함되게 되었다. 캐시 메모리가 내장된 CPU가 등장한 이후에도 CPU 외부에 별도 장착되는 캐시 메모리를 L2 캐시 메모리로 취급했었는데 L2 캐시 메모리는 CPU 클럭 속도와는 별개로 작동했기 때문에, 캐시 메모리의 클럭 속도가 시스템 전반적인 속도에 영향을 주었다.[* 펜티엄2 CPU] 펜티엄 이후 CPU에서 펜티엄용 메인보드는 CPU 근처에 용량이 정해진 온보드 캐시 메모리뿐만 아니라 별도의 캐시 메모리 슬롯까지 있어서 필요한 경우에 L2 캐시 메모리를 증설할 수도 있었는데 이것이 스틱형 캐시 모듈의 마지막 세대이기도 했다. 그 이후에는 L2 캐시 메모리도 CPU 칩 패키징 내에 넣으려는 시도가 있었고, x86 아키텍처 중 인텔에서는 1995년 11월 출시된 펜티엄 프로에서, AMD에서는 1999년 출시된 K6-III에서 최초로 실현되었다. L2 캐시 메모리가 CPU 내에 통합되기 시작한 시기에는 캐시 메모리가 실장된 형태가 On-die, On-package([[MCM#s-4]])로 구분되어 있었다. On-die 캐시는 하나의 다이 안에 CPU 코어와 L2 캐시 메모리가 함께 포함되어 있는 것이고, On-package 및 그와 유사한 용어는 CPU 코어와 L2 캐시 메모리 다이는 서로 나뉘어 있지만 하나의 패키징된 칩 안에서 서로 연결된 형태를 가리킨다. L2 캐시 메모리까지 CPU에 내장된 덕분에 메인보드에 실장되어 있던 캐시 메모리는 하위 레벨로 밀려나 L3 캐시 메모리로 명명되었다. L2 캐시 메모리까지 내장된 K6-III가 장착된 메인보드의 경우 온보드된 L3 캐시 메모리를 TriLevel Cache라고 불렀다. 인텔은 펜티엄 프로 시리즈에서 하나의 칩 안에 CPU 코어와 L2 캐시 메모리 다이를 모두 올리는 형태를 사용했다. 그러나 가격 문제 때문에 일반 사용자를 대상으로 한 펜티엄 2와 초기 펜티엄 3 카트마이 및 셀러론 모델에서는 CPU 코어와 L2 캐시 메모리를 별도 칩으로 분리했고, CPU 형태도 소켓에서 슬롯으로 바꾸었다. 슬롯 1이 사용되던 시기의 인텔 CPU에서는 CPU 코어와 별개로 외부 제조사에서 만든 캐시 메모리용 SRAM이 붙어 있었고, 셀러론은 캐시 메모리가 붙어 있지 않거나 용량이 더 작았다. AMD도 K6-III에서 On-die L2 캐시 메모리를 도입했으나, 인텔과 같은 이유로 인해서 초기형 애슬론은 슬롯 형태로 전환했다. 이 당시 쓰인 외부 캐시는 기술력 및 단가의 한계때문에 제조사와 모델에 따라 다르지만 CPU 클럭 스피드의 30~50%의 속도로 동작했다. 그러나 기술이 발전하여 On-die 캐시 메모리를 만들기 쉬워졌고, 외부 캐시 메모리의 클럭 레이트를 끌어 올리는 데에는 한계가 있기 때문에 인텔은 '''멘도시노 셀러론'''[* 더블 오버클럭 유행을 주도함.], 펜티엄 3 코퍼마인, AMD는 애슬론 선더버드부터 On-die L2 캐시 메모리로 복귀했다. 슬롯이 다시 소켓으로 돌아간 것은 보너스. 캐시 메모리의 속도 역시 CPU와 동기화돼서 성능 또한 향상되었다. 인텔은 초창기의 [[인텔 셀러론 시리즈]]인 코빙턴에서 L2 캐시 메모리를 없앴다가 '''엄청난 성능 저하를 보였다'''. 물론 L2 캐시 메모리가 원래 없었던 펜티엄 MMX와 동급 내지는 약간 더 나은 성능이긴 했으나, L2 캐시 메모리 있는 CPU와의 성능 격차가 너무 컸다. 이후 인텔은 아무리 저가형 모델이라고 하더라도 L2 캐시 메모리는 용량이 작더라도 항상 달고 나오기 시작했다. 펜티엄 3 ~ 4 의 전환기에는 일부 투알라틴 코어의 셀러론은 L2 캐시가 256KB나 되어 코퍼마인 펜티엄 3 보다 높은 성능인 제품도 있었다. 현세대에는 최소 L2, 보통 L3까지 존재한다. L3 캐시 메모리가 내장된 CPU는 인텔은 2002년 1세대 제온 MP 시리즈인 포스터 MP부터 도입되었다. [[파일:external/www.hardwareoverclock.com/P4-EE-10%20Kopie.jpg]] 데스크탑 제품군에서는 2003년에 출시된 갤러틴 [[제온]]을 기반으로 급조된 [[펜티엄 4]] Extreme Edition[* 원래 제온 시리즈에서만 볼 수 있었던 캐시 메모리였기 때문에 후속작인 프레스캇 기반의 펜티엄 4 익스트림 에디션은 L3 캐시 메모리가 없다.], 2008년 이후의 [[인텔 코어 i 시리즈]]가 있으며 AMD는 2007년 [[AMD 페넘 시리즈]]에서 L3 캐시 메모리를 도입한 후, [[AMD 페넘 II 시리즈]], [[AMD FX 시리즈]], [[AMD RYZEN 시리즈]] 등이 있다. 당연히 단계가 내려갈수록 용량은 증가하며, 반대급부로 속도는 상대적으로 떨어지게 된다. ~~물론 [[코어2 쿼드]]같이 L2 캐시가 '''12MB'''나 달린 깡패가 있긴 하다[* 참고로 2600K 조차 L3캐시가 8MB이며 13100F의경우 16MB다. '''12900K 조차도 L2캐시가 14MB다.''']~~ Intel Pentium 4 프로세서 부터 도입된 캐시 계층중 Trace 캐시와 현대 x86프로세서의 경우 uOP 캐시라는 개념이 도입되었는데 이는 x86이 CISC 라는 점에서 생긴 특징적인 캐시이다. CISC라는 특성상 한개의 명령어는 프로세서 입장에서 보면 한개를 초과하는 동작을 하는 추상적인 명령어가 존재하며 가변적인 길이라는 특징을 가지고 있으므로 이 명령어를 실행시키기 위해서는 파이프라인이 복잡해진다. 이 때문에 P6 아키텍처의 경우 파이프라인을 경량화하고 효율성을 증가시키기 위해 RISC의 설계 철학을 도입하여 CISC 명령을 RISC와 같이 개별 명령어로 쪼갠 uOP (Micro operation)개념을 도입했다. 하지만 CISC 명령어를 uOP으로 변환하는 과정을 매 인스트럭션 사이클마다 반복해야 하므로 디코더의 부하가 증가하는 것에 비해 uOP 캐시를 사용하면 CISC에서 uOP로 디코딩된 RISC같은 명령어가 들어 있어 디코딩 단계를 우회하는데 사용된다. 2015년 2분기 인텔의 코어 5세대 [[브로드웰]] 아키텍처 i7-5775c가 출시되었다. eDRAM 128MB의 초고용량[* 2014년 기준 L3캐시는 8MB(i7), 6MB(i5), 4MB(i3)가 일반적이었고, 2022년 기준으로도 30MB이상 L3 캐시는 인텔기준 i7,i9에만 탑재될정도로 대용량으로 취급받는다.] L4 캐시 메모리를 탑제했다. 주 목적은 CPU 내부의 내장 그래픽 캐시용이지만 내장 그래픽을 사용하지 않으면 CPU의 L4 캐시 메모리로 전환해 사용가능하다. 당시 기준으로 개인용 CPU에 128MB 용량이라는 큰 캐시메모리를 사용했으나 5세대 브로드웰 자체가 바로 얼마 뒤 나온 6세대 스카이레이크에 밀려서 크게 주목받지 못했다. 그러나 성능향상 하나는 확실해서 캐시 메모리 의존도가 높은 게임 분야나 서버분야[* 서버와 같이 했던 작업 또 반복적으로 하는 일이라면 캐시가 늘어난만큼 성능이 오르기는 한다.]는 7세대 카비레이크와 맏먹거나 소폭 우위였을 정도로 성능이 좋았다. 2022년 4월 3D V-Cache 기술을 사용한 [[AMD ZEN 3 마이크로아키텍처#s-4.2.2.1|Ryzen 7 5800X3D]]가 출시되었다. 100MB에 준하는 대용량 캐시를 수직적층이라는 기술로 접목시켜 실현시킨 제품이다. 용량이 큰 만큼 캐시적중률이 크게 오르고, 수직으로 CPU코어 위에 가까이 얹어놓았기에 기존 대용량 캐시의 단점인 레이턴시도 크게 늘어지지 않는다.[* 캐시 용량이 커질수록 넓은 면적을 차지하게 되고, 면적이 넓어질수록 코어와 캐시와의 거리는 멀어져 레이턴시가 증가하게 된다. 무턱대고 고용량의 캐시를 넣는다 해서 성능향상을 기대할 수 없는 이유이다. (물론 캐시메모리가 비싸기도 하다는 어른의 사정이 있지만(...)] 이에 따라 게임(맵 연산 등)에서 월등한 성능을 보여주며 게임 전용 CPU라는 타이틀을 획득하게 된다. 안타깝게도 게임/서버 외의 다른 작업[* 새로운 데이터를 디스크에서 읽어오고, 연산이 끝나 넘긴 후에는 이를 반복해서 활용하지 않는 작업들.]은 고용량의 캐시 메모리가 필요하지 않기에 (이 용량까지 활용할 알고리즘이 없기에) 성능향상은 미진한 편이긴 하며 3D V캐시 제품군은 오히려 발열을 더신경써야되기에[* 공식 오버클럭 미지원이며 전압조정도 최대 1.35V로 논3D판 보다 낮다.] 코어 i나 Non 3D V-Cache 라이젠이 좋다. 이처럼 인텔과 AMD의 주도아래 캐시 메모리의 중요성이 부각되면서 CPU 캐시 메모리 용량이 증가 추세에 있다. 또한 [[ARM Cortex-X 시리즈]] 등 고성능 ARM 프로세서에서도 가격 조정을 위해 원래 설계상에서 있던 캐시 메모리를 AP 제조사들이 커스텀하면서 반토막 냈다가 성능에 크게 영향을 받기도 하여 이런 행위를 자제하게 되는 등 다른 CPU 아키텍처에서도 캐시 메모리의 중요성이 커졌다.저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기